随着在敏感应用中广泛使用复杂的机器学习模型,了解他们的决策已成为一项重要任务。对表格数据进行培训的模型在解释其基本决策过程的解释方面取得了重大进展,该过程具有少量的离散功能。但是,将这些方法应用于高维输入(例如图像)并不是一项琐碎的任务。图像由原子水平的像素组成,并不具有任何解释性。在这项工作中,我们试图使用带注释的图像的高级可解释特征来提供解释。我们利用游戏理论的Shapley价值框架,该框架在XAI问题中广泛接受。通过开发一条管道来生成反事实并随后使用它来估计莎普利值,我们获得了具有强大的公理保证的对比度和可解释的解释。
translated by 谷歌翻译
尽管它们的准确性很高,但由于未知的决策过程和潜在的偏见,现代复杂的图像分类器不能被敏感任务受到信任。反事实解释非常有效地为这些黑盒算法提供透明度。然而,生成可能对分类器输出产生一致影响并揭示可解释的特征更改的反事实是一项非常具有挑战性的任务。我们介绍了一种新颖的方法,可以使用验证的生成模型为图像分类器生成因果关系但可解释的反事实解释,而无需进行任何重新训练或调节。该技术中的生成模型不可能在与目标分类器相同的数据上进行训练。我们使用此框架来获得对比度和因果关系,并作为黑盒分类器的全球解释。在面部属性分类的任务上,我们通过提供因果和对比特征属性以及相应的反事实图像来展示不同属性如何影响分类器输出。
translated by 谷歌翻译
Nerf-based Generative models have shown impressive capacity in generating high-quality images with consistent 3D geometry. Despite successful synthesis of fake identity images randomly sampled from latent space, adopting these models for generating face images of real subjects is still a challenging task due to its so-called inversion issue. In this paper, we propose a universal method to surgically fine-tune these NeRF-GAN models in order to achieve high-fidelity animation of real subjects only by a single image. Given the optimized latent code for an out-of-domain real image, we employ 2D loss functions on the rendered image to reduce the identity gap. Furthermore, our method leverages explicit and implicit 3D regularizations using the in-domain neighborhood samples around the optimized latent code to remove geometrical and visual artifacts. Our experiments confirm the effectiveness of our method in realistic, high-fidelity, and 3D consistent animation of real faces on multiple NeRF-GAN models across different datasets.
translated by 谷歌翻译
3D重建问题中的一个关键问题是如何训练机器人或机器人以模型3D对象。在实时系统(例如自动驾驶汽车)中导航等许多任务直接取决于此问题。这些系统通常具有有限的计算能力。尽管近年来3D重建系统在3D重建系统中取得了长足的进展,但由于现有方法的高复杂性和计算需求,将它们应用于自动驾驶汽车中的导航系统等实时系统仍然具有挑战性。这项研究解决了以更快(实时)方式重建单视图像中显示的对象的当前问题。为此,开发了一个简单而强大的深度神经框架。提出的框架由两个组件组成:特征提取器模块和3D发电机模块。我们将点云表示为我们的重建模块的输出。将Shapenet数据集用于将方法与计算时间和准确性方面的现有结果进行比较。模拟证明了所提出的方法的出色性能。索引术语现实时间3D重建,单视图重建,监督学习,深神经网络
translated by 谷歌翻译
本文着重于基于雷达的同时定位和映射(SLAM)中的有效地标管理。必须进行地标管理,以保持相对于平台姿势估计的估计地标的一致地图。当面对从相同地标和/或动态环境的多个检测到地标可以更改的地标和/或动态环境时,此任务尤其重要。雷达数据的另一个挑战是存在错误检测。因此,我们为Radar Slam Landmark Management提出了一个简单而有效的规则解决方案。假设我们的解决方案中有几个步骤:需要检测并包括新的地标,需要识别和删除虚假地标,并且需要维护地图中注册的地标的一致性。为了说明我们的解决方案,我们在包含固定和固定地标的环境中运行扩展的Kalman Filter Slam算法。我们的仿真结果表明,即使面对虚假检测和来自同一地标的多次检测,提出的解决方案也能够可靠地管理地标。
translated by 谷歌翻译
在本文中,我们分析了数据新鲜度对实时监督学习的影响,在该学习中,对神经网络进行了培训,可以根据功能(例如,视频框架)推断出时间变化的目标(例如,车辆在前面的位置) )在传感节点(例如,相机或激光雷达)上观察到。人们可能会期望随着功能变得陈旧,实时监督学习的表现会单调地降低。使用信息理论分析,我们表明,如果特征和目标数据序列可以与马尔可夫链紧密接近,这是正确的。如果数据序列远非马克维亚人,那是不正确的。因此,实时监督学习的预测错误是信息时代(AOI)的函数,该函数可能是非单调的。进行了几项实验,以说明预测误差的单调和非单调行为。为了最大程度地减少实时的推理误差,我们提出了一种用于发送功能的新“选择 - 逃避器”模型,该模型比早期研究中使用的“生成意志”模型更一般。通过使用Gittins和Whittle索引,开发了低复杂性调度策略来最大程度地减少推理误差,在此发现Gittins索引理论与信息时代(AOI)之间的新联系最小化。这些调度结果(i)可将一般AOI函数(单调或非单调)和(ii)最小化,以最大程度地减少一般特征传输时间分布。提出了数据驱动的评估,以说明提出的调度算法的好处。
translated by 谷歌翻译
眼科图像可能包含相同的外观病理,这些病理可能导致自动化技术的失败以区分不同的视网膜退行性疾病。此外,依赖大型注释数据集和缺乏知识蒸馏可以限制基于ML的临床支持系统在现实环境中的部署。为了提高知识的鲁棒性和可传递性,需要一个增强的特征学习模块才能从视网膜子空间中提取有意义的空间表示。这样的模块(如果有效使用)可以检测到独特的疾病特征并区分这种视网膜退行性病理的严重程度。在这项工作中,我们提出了一个具有三个学习头的健壮疾病检测结构,i)是视网膜疾病分类的监督编码器,ii)一种无监督的解码器,用于重建疾病特异性的空间信息,iiii iii)一个新的表示模块,用于学习模块了解编码器折叠功能和增强模型的准确性之间的相似性。我们对两个公开可用的OCT数据集的实验结果表明,该模型在准确性,可解释性和鲁棒性方面优于现有的最新模型,用于分布视网膜外疾病检测。
translated by 谷歌翻译
神经代码智能(CI)模型是不透明的黑盒,几乎没有关于他们在预测中使用的功能的见解。这种不透明度可能会导致他们的预测不信任,并阻碍其在安全至关重要的应用中的广泛采用。最近,已经提出了输入程序减少技术来识别输入程序中的关键功能,以提高CI模型的透明度。但是,这种方法是语法 - 乌纳威,不考虑编程语言的语法。在本文中,我们采用了语法引导的减少技术,该技术在减少过程中考虑了输入程序的语法。我们对不同类型输入程序的多个模型进行的实验表明,语法引导的减少技术更快,并且在简化程序中提供了较小的关键令牌集。我们还表明,关键令牌可用于生成对抗性示例,最多可用于65%的输入程序。
translated by 谷歌翻译
在神经模型的输入向量中编码源代码有几种方法。这些方法尝试在其编码中包含输入程序的各种句法和语义特征。在本文中,我们调查Code2Snapshot,这是基于输入程序的快照的源代码的新颖表示。我们评估此表示的几种变体,并将其与利用输入程序的丰富的句法和语义特征的最先进的表示性能进行比较。我们对代码2SNAPSHOT在代码摘要任务中的实用性的初步研究表明,输入程序的简单快照对最先进的表示具有可比性。有趣的是,模糊的输入程序对Code2sNapshot性能的影响微不足道,这表明,对于一些任务,神经模型可以通过仅仅依赖于输入程序的结构来提供高性能。
translated by 谷歌翻译
从心电图中自动化心律失常的自动化检测需要一个可靠且值得信赖的系统,该系统在电动扰动下保持高精度。许多机器学习方法在对心电图的心律不齐分类方面已经达到了人类水平的表现。但是,这些体系结构容易受到对抗攻击的影响,这可能会通过降低模型的准确性来误解ECG信号。对抗性攻击是在原始数据中注入的小型制作的扰动,这些扰动表现出信号的过度分发转移,以错误地分类正确的类。因此,滥用这些扰动的虚假住院和保险欺诈引起了安全问题。为了减轻此问题,我们引入了第一个新型的条件生成对抗网络(GAN),可抵抗对抗性攻击的ECG信号,并保持高精度。我们的体系结构集成了一个新的类加权目标函数,用于对抗扰动识别和新的块,用于辨别和组合学习过程中信号中的分布外变化,以准确地对各种心律失常类型进行分类。此外,我们在六种不同的白色和黑色盒子攻击上对架构进行了基准测试,并将它们与最近提出的其他心律失常分类模型进行比较,这是两个公开可用的ECG心律失常数据集。该实验证实,我们的模型对这种对抗性攻击更为强大,以高精度对心律不齐进行分类。
translated by 谷歌翻译